CatBoost এবং Pandas/NumPy এর সাথে Integration

 

CatBoost একটি শক্তিশালী Gradient Boosting লাইব্রেরি, যা ক্যাটেগোরিক্যাল ডেটা পরিচালনা করার জন্য বিশেষভাবে ডিজাইন করা হয়েছে। Pandas এবং NumPy হল জনপ্রিয় Python লাইব্রেরি যা ডেটা বিশ্লেষণ এবং গণনার জন্য ব্যবহৃত হয়। CatBoost, Pandas এবং NumPy-এর মধ্যে একটি সুষ্ঠু সংযোগ রয়েছে, যা ডেটা প্রক্রিয়াকরণের এবং মডেল ট্রেনিংয়ের জন্য সহজ ও কার্যকরী উপায় সরবরাহ করে।

CatBoost এবং Pandas/NumPy এর সাথে Integration

১. লাইব্রেরি ইনস্টলেশন

প্রথমে নিশ্চিত করুন যে আপনার সিস্টেমে CatBoost, Pandas এবং NumPy ইনস্টল আছে। ইনস্টল করতে নিচের কমান্ডগুলি ব্যবহার করুন:

pip install catboost pandas numpy

২. ডেটাসেট প্রস্তুতি

Pandas ব্যবহার করে একটি ডেটাসেট তৈরি করুন বা একটি বিদ্যমান ডেটাসেট লোড করুন। এখানে আমরা একটি কল্পিত ডেটাসেট তৈরি করছি।

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split

# উদাহরণ ডেটাসেট তৈরি
data = {
    'feature1': np.random.rand(100),
    'feature2': np.random.choice(['A', 'B', 'C'], 100),
    'target': np.random.choice([0, 1], 100)
}

df = pd.DataFrame(data)

# ডেটা ভাগ করা: 80% ট্রেনিং এবং 20% টেস্টিং
X = df[['feature1', 'feature2']]
y = df['target']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

৩. CatBoostClassifier ব্যবহার করে মডেল ট্রেনিং

CatBoost মডেল তৈরি এবং ট্রেনিং করার জন্য নিচের পদক্ষেপগুলি অনুসরণ করুন।

from catboost import CatBoostClassifier

# ক্যাটেগোরিক্যাল বৈশিষ্ট্যগুলি উল্লেখ করুন
categorical_features_indices = [1]  # feature2 হল ক্যাটেগোরিক্যাল ফিচার

# CatBoostClassifier মডেল তৈরি
model = CatBoostClassifier(iterations=100, learning_rate=0.1, depth=6, cat_features=categorical_features_indices, verbose=0)

# মডেল প্রশিক্ষণ
model.fit(X_train, y_train)

৪. মডেল পূর্বাভাস এবং ফলাফল মূল্যায়ন

# পূর্বাভাস করা
predictions = model.predict(X_test)

# ফলাফল দেখানো
print("\nPredictions:")
print(predictions)

# সঠিকতা মূল্যায়ন
from sklearn.metrics import accuracy_score

accuracy = accuracy_score(y_test, predictions)
print(f"\nAccuracy: {accuracy * 100:.2f}%")

৫. NumPy অ্যারেতে ডেটা ব্যবহার করা

CatBoost ডেটা NumPy অ্যারেতে ব্যবহার করতে পারে। নিচে NumPy এর সাহায্যে ডেটাসেট তৈরি করে CatBoost ব্যবহার করার উদাহরণ দেওয়া হলো। 

# NumPy অ্যারেতে ডেটা তৈরি
X_np = np.array(X)
y_np = np.array(y)

# ডেটা ভাগ করা: 80% ট্রেনিং এবং 20% টেস্টিং
X_train_np, X_test_np, y_train_np, y_test_np = train_test_split(X_np, y_np, test_size=0.2, random_state=42)

# CatBoostClassifier মডেল তৈরি
model_np = CatBoostClassifier(iterations=100, learning_rate=0.1, depth=6, cat_features=[1], verbose=0)

# NumPy অ্যারেতে মডেল প্রশিক্ষণ
model_np.fit(X_train_np, y_train_np)

# পূর্বাভাস করা
predictions_np = model_np.predict(X_test_np)

# ফলাফল দেখানো
print("\nNumPy Predictions:")
print(predictions_np)

# সঠিকতা মূল্যায়ন
accuracy_np = accuracy_score(y_test_np, predictions_np)
print(f"\nNumPy Accuracy: {accuracy_np * 100:.2f}%")

উপসংহার

CatBoost, Pandas, এবং NumPy এর সংযোগ ব্যবহারকারীদের জন্য একটি শক্তিশালী এবং নমনীয় মেশিন লার্নিং পরিবেশ তৈরি করে। CatBoost-এর ক্যাটেগোরিক্যাল ডেটার জন্য বিশেষায়িত কৌশলগুলি এবং Pandas/NumPy-এর শক্তিশালী ডেটা প্রক্রিয়াকরণের ক্ষমতা একত্রে একটি কার্যকরী সমাধান প্রদান করে। এই প্রযুক্তিগুলি ব্যবহার করে আপনি আপনার মডেলগুলিকে সহজে প্রশিক্ষণ এবং বিশ্লেষণ করতে পারবেন।

Content added By

আরও দেখুন...

Promotion